Đa hình nucleotid đơn là gì? Nghiên cứu khoa học liên quan

Đa hình nucleotid đơn (SNP) là biến thể di truyền phổ biến nhất, xảy ra khi một bazơ đơn trong chuỗi DNA bị thay thế tại một vị trí cụ thể. SNP có thể nằm ở mọi vị trí trong bộ gen và dù phần lớn không gây hại, chúng đóng vai trò quan trọng trong nghiên cứu di truyền, bệnh học và y học cá nhân hóa.

Giới thiệu về đa hình nucleotid đơn (SNP)

Đa hình nucleotid đơn, thường được gọi tắt là SNP (Single Nucleotide Polymorphism), là dạng biến thể di truyền phổ biến nhất trong bộ gen của người và nhiều loài sinh vật khác. Một SNP xuất hiện khi một bazơ nitơ trong trình tự DNA bị thay thế bởi một bazơ khác tại một vị trí nhất định trên nhiễm sắc thể. Ví dụ, tại một vị trí cụ thể trong chuỗi DNA, cá thể này mang adenine (A), trong khi cá thể khác lại mang guanine (G). Thay đổi này tạo thành một SNP.

Sự tồn tại của SNP trong quần thể thường không gây ảnh hưởng đến khả năng sống còn hoặc chức năng sinh học, nhưng chúng có thể liên quan đến những khác biệt về sinh lý, phản ứng với thuốc hoặc nguy cơ mắc bệnh. Để được coi là một SNP đúng nghĩa, biến thể phải xuất hiện với tần suất ít nhất 1% trong một quần thể nhất định. Dưới ngưỡng này, nó được phân loại là đột biến hiếm.

Các SNP phân bố rộng khắp trong bộ gen. Trong bộ gen người, ước tính có khoảng 4-5 triệu SNP khác nhau giữa hai người bất kỳ. Những biến thể này chiếm tới 90% tổng số khác biệt di truyền giữa các cá thể. Do đó, SNP là công cụ cực kỳ giá trị trong nghiên cứu về tính đa dạng di truyền, sự tiến hóa của loài người, và cơ sở di truyền của bệnh tật.

Đặc điểm sinh học của SNP

SNP có thể xảy ra ở bất kỳ vị trí nào trên bộ gen: vùng mã hóa (exon), vùng không mã hóa (intron), vùng điều hòa (promoter, enhancer) và các vùng giữa gen (intergenic regions). Tuy nhiên, tác động sinh học của SNP phụ thuộc vào vị trí xuất hiện và vai trò của đoạn gen đó. SNP trong vùng mã hóa có thể ảnh hưởng trực tiếp đến chuỗi axit amin của protein, trong khi SNP ở vùng điều hòa có thể làm thay đổi mức độ biểu hiện gen.

Có thể phân loại SNP theo vị trí và hậu quả chức năng như sau:

  • Synonymous SNP: Không làm thay đổi axit amin trong protein.
  • Non-synonymous SNP: Làm thay đổi axit amin, có thể ảnh hưởng đến chức năng protein.
  • Nonsense SNP: Tạo codon kết thúc sớm, gây cắt ngắn protein.
  • Regulatory SNP: Ảnh hưởng đến các yếu tố điều hòa, thay đổi biểu hiện gen.

Đặc điểm phân bố của SNP thường không đồng đều trong bộ gen. Một số vùng, gọi là "hotspot", có mật độ SNP cao do cấu trúc DNA dễ bị biến đổi hoặc do áp lực chọn lọc tiến hóa. Bảng dưới đây cho thấy tỷ lệ SNP phổ biến tại các vùng chính trong bộ gen người:

Vị trí Tỷ lệ SNP Ảnh hưởng tiềm tàng
Vùng mã hóa (exon) ~1-2% Ảnh hưởng cấu trúc protein
Vùng không mã hóa (intron) ~24% Ảnh hưởng ghép nối RNA
Vùng điều hòa ~8% Ảnh hưởng biểu hiện gen
Vùng liên gen ~65% Ít ảnh hưởng trực tiếp

Cơ chế phát sinh SNP

SNP hình thành chủ yếu từ các lỗi sao chép DNA trong quá trình nhân đôi tế bào. DNA polymerase là enzyme chịu trách nhiệm tổng hợp DNA, nhưng không phải lúc nào cũng sao chép chính xác. Mặc dù hệ thống sửa lỗi trong tế bào có thể nhận diện và sửa sai, một số lỗi vẫn được giữ lại và truyền sang thế hệ tế bào kế tiếp, trở thành SNP ổn định trong bộ gen.

Ngoài ra, các yếu tố môi trường cũng đóng vai trò trong việc tạo ra SNP, như:

  • Bức xạ ion hóa (UV, X-quang)
  • Hóa chất gây đột biến (benzopyrene, nitrosamine)
  • Viêm mãn tính và stress oxy hóa

Một cơ chế phổ biến là quá trình khử amin của cytosine (C), biến đổi thành uracil (U), sau đó chuyển thành thymine (T) trong quá trình sửa chữa DNA:

CUTC \rightarrow U \rightarrow T

Hiện tượng này làm xuất hiện một SNP tại vị trí đó. Đáng chú ý, CpG dinucleotide là nơi thường xảy ra SNP do cytosine dễ bị methyl hóa, và các cytosine methyl hóa dễ bị khử amin thành thymine.

Ứng dụng trong nghiên cứu di truyền

SNP là công cụ không thể thiếu trong các nghiên cứu liên kết gen, đặc biệt là trong các nghiên cứu GWAS (Genome-Wide Association Studies). Mục tiêu của GWAS là tìm ra SNP liên quan đến các tính trạng phức tạp hoặc bệnh di truyền thông qua việc so sánh tần suất xuất hiện SNP giữa nhóm mắc bệnh và nhóm đối chứng khỏe mạnh.

Ví dụ, nhiều SNP đã được xác định có liên quan đến bệnh lý phổ biến như:

  • Tiểu đường tuýp 2
  • Bệnh tim mạch
  • Ung thư vú
  • Rối loạn phổ tự kỷ

Một số công cụ và cơ sở dữ liệu chuyên biệt để tra cứu SNP trong nghiên cứu:

  • NCBI dbSNP: cơ sở dữ liệu lưu trữ hàng triệu SNP từ nhiều dự án toàn cầu.
  • Ensembl: nền tảng phân tích SNP tích hợp với thông tin biểu hiện gen và biến thể protein.
  • GWAS Central: cơ sở dữ liệu chuyên về kết quả GWAS công bố.

Nhờ SNP, các nhà khoa học có thể tạo bản đồ liên kết gen, định danh các locus gây bệnh và hiểu rõ cơ chế sinh học của các rối loạn di truyền. Điều này mở đường cho các chiến lược can thiệp y học chính xác và phòng bệnh hiệu quả hơn.

Vai trò trong y học cá nhân hóa

SNP có vai trò trung tâm trong lĩnh vực y học cá nhân hóa – một hướng tiếp cận nhằm điều chỉnh chiến lược điều trị, chẩn đoán và phòng bệnh phù hợp với đặc điểm di truyền của từng cá nhân. Các SNP có thể ảnh hưởng đến cách cơ thể con người hấp thu, chuyển hóa và phản ứng với thuốc. Đây là nền tảng của dược di truyền học (pharmacogenomics).

Một ví dụ điển hình là SNP tại gen CYP2C19, mã hóa enzyme chuyển hóa thuốc. Cá thể mang alen không hoạt động của gen này có khả năng chuyển hóa kém đối với thuốc chống kết tập tiểu cầu clopidogrel, làm tăng nguy cơ nhồi máu cơ tim sau đặt stent. Việc xét nghiệm SNP trước điều trị giúp bác sĩ điều chỉnh phác đồ phù hợp.

Một số SNP liên quan đến phản ứng thuốc đã được xác thực và ứng dụng lâm sàng:

Gen Thuốc liên quan Ảnh hưởng
TPMT Azathioprine Nguy cơ độc tính nếu giảm hoạt động TPMT
VKORC1 Warfarin Liều dùng tùy thuộc kiểu gen
HLA-B*5701 Abacavir Nguy cơ phản ứng dị ứng nặng

Ngoài ra, SNP còn được sử dụng để đánh giá nguy cơ di truyền đối với các bệnh lý như:

  • Ung thư vú (SNP tại BRCA1/BRCA2)
  • Alzheimer (SNP tại APOE, nhất là alen ε4)
  • Đái tháo đường typ 2 (SNP tại TCF7L2)

Tiềm năng trong công nghệ chỉnh sửa gen

Sự phát triển của công nghệ chỉnh sửa gen, đặc biệt là CRISPR-Cas9, mở ra khả năng điều chỉnh trực tiếp các SNP gây bệnh tại cấp độ DNA. Điều này hứa hẹn mang đến các liệu pháp điều trị dứt điểm nhiều bệnh di truyền.

CRISPR-Cas9 hoạt động như một “cây kéo phân tử” được hướng dẫn bởi RNA, cắt chính xác tại vị trí SNP cần sửa. Sau đó, tế bào sẽ tự sửa chữa bằng cách thay thế đoạn DNA lỗi bằng một trình tự chính xác. Đối với các SNP gây bệnh có cơ chế đã được xác định rõ, công nghệ này cho phép thiết kế liệu pháp gen đặc hiệu.

Các ứng dụng hiện đang được nghiên cứu bao gồm:

  • Điều trị bệnh thiếu máu hồng cầu hình liềm (sickle cell disease) do SNP tại gen HBB
  • Chỉnh sửa SNP gây loạn dưỡng cơ Duchenne
  • Can thiệp các SNP ảnh hưởng đến biểu hiện gen trong bệnh ung thư

Đọc thêm về các nghiên cứu liên quan tại Broad Institute – CRISPR Spotlight.

SNP và tiến hóa

SNP là một trong những dấu hiệu di truyền hữu ích nhất để nghiên cứu sự tiến hóa của loài người và các loài khác. Vì SNP tích lũy dần theo thời gian, chúng cung cấp một “dấu vết phân tử” cho các nhà sinh học truy ngược nguồn gốc tổ tiên, đánh giá mức độ đa dạng di truyền và xác định các dòng di truyền trong quần thể.

Ví dụ, trong nghiên cứu về dòng di truyền ty thể và nhiễm sắc thể Y, các SNP đặc hiệu được sử dụng để xác định các haplogroup – nhóm người có tổ tiên chung từ hàng ngàn năm trước. Điều này hỗ trợ việc vẽ bản đồ di cư của tổ tiên loài người từ châu Phi ra toàn cầu.

Một số ứng dụng SNP trong nghiên cứu tiến hóa:

  • Phân tích sự thích nghi của quần thể với môi trường (như SNP liên quan đến khả năng chịu lạnh ở người châu Âu)
  • Xác định sự chọn lọc tích cực trong tiến hóa (ví dụ: SNP tại LCT liên quan đến khả năng tiêu hóa lactose)
  • So sánh bộ gen giữa người và loài linh trưởng để hiểu sự phân tách tiến hóa

Phân tích SNP trong thực hành lâm sàng và sinh học phân tử

Phân tích SNP là một phần quan trọng trong các nghiên cứu di truyền lâm sàng, giúp xác định các marker di truyền liên quan đến bệnh tật, phản ứng thuốc và đặc điểm sinh lý. Có nhiều kỹ thuật được sử dụng để phát hiện và định danh SNP, từ công nghệ truyền thống đến hiện đại.

Các phương pháp phổ biến hiện nay bao gồm:

  • Microarray genotyping: Gắn mẫu DNA với các chip chứa hàng trăm nghìn đầu dò SNP đặc hiệu.
  • Giải trình tự thế hệ mới (NGS): Xác định chính xác từng bazơ trên toàn bộ genome hoặc exome.
  • Kỹ thuật TaqMan Assay: Sử dụng đầu dò huỳnh quang đặc hiệu cho từng alen.
  • High Resolution Melting (HRM): Phân tích độ nóng chảy của DNA để phát hiện biến thể nhỏ.

Một số nền tảng công cụ phân tích SNP hữu ích:

  • Ensembl Genome Browser: tra cứu vị trí, tần suất và tác động của SNP.
  • NCBI dbSNP: cơ sở dữ liệu trung tâm lưu trữ và phân tích biến thể di truyền.
  • SNPedia: thư viện cộng đồng về SNP và liên kết với kiểu hình.

Tài liệu tham khảo

  1. Collins, F.S., Brooks, L.D., & Chakravarti, A. (1998). A DNA polymorphism discovery resource for research on human genetic variation. Genome Research, 8(12), 1229–1231.
  2. Brookes, A.J. (1999). The essence of SNPs. Gene, 234(2), 177–186.
  3. NCBI dbSNP Database
  4. National Human Genome Research Institute (NHGRI) – SNP glossary
  5. Broad Institute
  6. Shastry, B.S. (2002). SNPs: impact on gene function and phenotype. Methods in Molecular Biology, 212, 145–164.
  7. PharmGKB. https://www.pharmgkb.org/
  8. Manolio, T.A. et al. (2009). Finding the missing heritability of complex diseases. Nature, 461, 747–753.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề đa hình nucleotid đơn:

Trình tự bộ gen của muỗi truyền bệnh sốt rét Anopheles gambiae Dịch bởi AI
American Association for the Advancement of Science (AAAS) - Tập 298 Số 5591 - Trang 129-149 - 2002
Anopheles gambiae là vector chính của bệnh sốt rét, căn bệnh gây ảnh hưởng đến hơn 500 triệu người và làm hơn 1 triệu người tử vong mỗi năm. Đã thu thập phạm vi trình tự 10 lần của chủng PEST của A. gambiae và lắp ráp thành các scaffold bao phủ 278 triệu cặp base. Tổng cộng, 91% bộ gen được tổ chức thành 303 scaffold; scaffold lớn nhất dài 23.1 triệu cặp base. Có sự thay đổi di truyền đáng kể tron... hiện toàn bộ
#trình tự bộ gen #Anopheles gambiae #vector bệnh sốt rét #đa hình nucleotide đơn #khả năng thích nghi sinh lý #bám dính tế bào #miễn dịch #chủng PEST
Điều chỉnh mục tiêu phụ thuộc vào miRNA: đặc trưng chức năng của các đa hình nucleotide đơn được xác định trong các nghiên cứu liên kết toàn bộ gen về bệnh Alzheimer Dịch bởi AI
Springer Science and Business Media LLC - - 2016
Tóm tắt Điều kiện nghiên cứu Một lượng ngày càng tăng bằng chứng cho thấy rằng microRNA (miRNA) có liên quan đến bệnh Alzheimer (AD) và một số biến thể gen liên quan đến bệnh được xác định nằm trong các điểm gắn kết miRNA. Trong nghiên cứu hiện tại, chúng tôi đã cố gắng đặc trưng hóa các đa hình chức năng trong các điểm mục tiêu miRNA trong các loci được xác định trong các nghiên cứu liên kết toàn... hiện toàn bộ
Bước đầu nghiên cứu đa hình nucleotide đơn MC4R-rs17782313 ở trẻ 5-6 tuổi Hà Nội bằng phương pháp PCR-RFLP
Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ - Tập 31 Số 3 - 2015
Gen MC4R (melanocortin 4 receptor) có vai trò quan trọng trong điều hòa ăn uống và trao đổi chất ở người. Đa hình nucleotide đơn (SNP) rs17782313 nằm phía sau gen MC4R 188 kp có ảnh hưởng đến sự biểu hiện của gen này. Các nghiên cứu di truyền cho thấy alen C của SNP rs17782313 liên quan đến nhiều bệnh tật ở người như béo phì, đái tháo đường. Mục tiêu của nghiên cứu là ứng dụng phương pháp PCR-RFLP... hiện toàn bộ
Mối liên hệ của các dị biến gen Interleukin-1 với béo phì trung tâm và hội chứng chuyển hóa trong quần thể bệnh nhân bệnh tim mạch Dịch bởi AI
Springer Science and Business Media LLC - Tập 124 - Trang 199-206 - 2008
Mục tiêu của nghiên cứu này là xác định xem các đa hình nucleotide đơn (SNP) trong gia đình gen Interleukin-1 (IL-1) có liên quan đến béo phì trung tâm và hội chứng chuyển hóa ở quần thể bệnh nhân mắc bệnh tim mạch vành hay không. Các SNP IL-1α C-889T (rs1800587) và IL-1β +3954 (rs1143634) đã được nghiên cứu trong một quần thể bệnh nhân bệnh tim mạch vành ở Tây Australia (N = 556). Những đối tượng... hiện toàn bộ
#Interleukin-1 #béo phì trung tâm #hội chứng chuyển hóa #đa hình nucleotide đơn #bệnh tim mạch vành
ĐA HÌNH NUCLEOTID ĐƠN 45T/G CỦA GEN ADIPONECTIN Ở THAI PHỤ ĐÁI THÁO ĐƯỜNG THAI KỲ
Tạp chí Y học Việt Nam - Tập 518 Số 1 - 2022
Mục tiêu nghiên cứu: Tìm hiểu mối liên quan giữa đa hình nucleotid đơn 45T/G trong gen adiponectin với nguy cơ đái tháo đường thai kỳ (ĐTĐTK) ở Việt Nam. Đối tượng và phương pháp nghiên cứu: Nghiên cứu được thực hiện trên 45 bệnh nhân mắc ĐTĐTK và 45 phụ nữ mang thai khỏe mạnh. Xác định kiểu gen của SNP 45T/G trong gen adiponectin được thực hiện bằng phương pháp đa hình chiều dài đoạn cắt giới hạn... hiện toàn bộ
#đa hình nucleotid đơn 45T/G #gen adiponectin #đái tháo đường thai kỳ
4. Đa hình nucleotid đơn gen oprd1 trong điều trị methadone thay thế ở bệnh nhân nghiện chất dạng thuốc phiện
Tạp chí Nghiên cứu Y học - - 2022
Nghiên cứu thực hiện phân tích phân bố kiểu gen OPRD1 tại vị trí đa hình nucleotid đơn rs2234918, rs581111, rs529520 và đánh giá mối tương quan với liều duy trì methadone trong liệu pháp điều trị thay thế methadone ở bệnh nhân nghiện chất dạng thuốc phiện tại tỉnh Ninh Bình. Nghiên cứu thực hiện trên 400 bệnh nhân được chẩn đoán phụ thuộc vào các chất dạng thuốc phiện, được điều trị Methadone thay... hiện toàn bộ
#Nghiện chất dạng thuốc phiện #methadone #cá thể hóa điều trị #gen OPRD1 #SNP rs2234918 #SNP rs529520 #SNP rs581111
Tính đa hình và đặc điểm nhân trắc ở các nhóm kiểu gen của đa hình nucleotide đơn rs6548238 gen TMEM18 ở trẻ tiểu học Miền Bắc, Việt Nam
Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ - Tập 33 Số 1 - 2017
In human, TMEM18 protein (Transmembrane protein 18) is involved in the migratory response of neural precursors toward glioma-secreted factors and the overexpression of TMEM18 resulted increased the migration of human neural precursor cells. Single nucleotide polymorphism (SNP) rs6548238 locates at regulatory region near the TMEM18 gene, which results in the substitution of T for C in the DNA seque... hiện toàn bộ
Mối liên quan giữa đa hình đơn gen IL-17F RS763780, IL-17RA RS4819554 VÀ HLA-CW6 trên bệnh vảy nến thông thường ở Việt Nam
Tạp chí Nghiên cứu Y học - - 2022
Vảy nến là bệnh viêm mạn tính, yếu tố di truyền đóng góp 30% trong cơ chế bệnh sinh, vì vậy xác định các dấu ấn sinh học giúp dự đoán đáp ứng điều trị và tiên lượng. Nghiên cứu khảo sát đặc điểm lâm sàng bệnh nhân vảy nến thể mảng, tỉ lệ và kiểu gen IL-17F RS763780, IL17RA rs4819554 và HLA-Cw6 ở người Việt Nam. 121 bệnh nhân vảy nến được lấy mẫu máu ngoại vi, sau đó tách chiết DNA và giải trình tự... hiện toàn bộ
#Đa hình đơn nucleotides #IL17RA #rs4819554 #RS763780 #HLA-Cw6 #vảy nến
Tổng số: 27   
  • 1
  • 2
  • 3